GTC 2023 春 — AI 的 iPhone 时刻
开场:曲速引擎是加速计算,能量源是 AI
GTC 2023 春是 NVIDIA 第一次在台面上把 ChatGPT 的冲击波全面整合进它的产业叙事里。黄仁勋给出了那年最好记的一句金句:
"曲速引擎是 加速计算,而能量源是 AI。生成式 AI 的惊人能力,让全世界的公司都产生了一种紧迫感——必须重新构想自己的产品和业务模式。"
78 分钟的演讲里,他讲清楚了四件事:
1. ChatGPT 不是终点,是起点——AI 进入"iPhone 时刻"。
2. H100 与 Grace Hopper——为大模型专门设计的新一代硬件。
3. DGX Cloud 与 AI Foundations——让 AI 瞬间抵达每一家企业。
4. cuLitho——把加速计算带进芯片制造本身,让 2 纳米成为可能。
AI 的 iPhone 时刻:DGX 是现代 AI 工厂
他把故事往回拉到 2016 年:"我亲手把第一台 NVIDIA DGX AI 超级计算机送到 OpenAI——那就是今天驱动 ChatGPT 的大语言模型背后的引擎。"
"ChatGPT 去年底发布,几乎在一夜之间成为主流,1 亿用户——史上增长最快的应用。我们正处于 AI 的 iPhone 时刻。"
然后他给出了一句标志性的定位:"DGX 超级计算机,曾经是 AI 研究的仪器,现在正 24/7 地在全球的企业里运行,提炼数据、处理 AI。财富 100 强里有一半都装了 DGX AI 超算——DGX 超级计算机就是现代的 AI 工厂。"
这是"AI 工厂"这个概念从隐喻走向产品定位的关键一刻。GTC 2021 春他只是用 AI 工厂形容未来数据中心的方向;到了 2023 春,DGX 本身就被重命名为 AI Factory。
H100、Grace Hopper、Grace:为 AI 而生的芯片栈
"部署 ChatGPT 这样的大语言模型是一种全新的、规模巨大的推理工作负载。" 他为此发布了 H100 NVL——一对 H100 通过 NVLink 连在一起的变种,专门为 Hopper 处理 GPT 这类模型而设计。"一台标配 4 对 H100 NVL 的服务器,在做 GPT-3 推理时,速度可达 HGX A100 的 10 倍。H100 可以把大语言模型的处理成本降一个数量级。"
同时他正式宣布 Grace CPU 开始送样——"云计算在过去十年以 20% 的年增长率长成了一个万亿美元的行业。我们为一个 AI 优先、云优先的世界设计了 Grace CPU——在这个世界里,AI 工作负载是 GPU 加速的。"
而真正的核心是 Grace Hopper 超级芯片(GH200)——通过 900 GB/s 的 chip-to-chip 相干互联,把 Grace CPU 和 Hopper GPU 连成一块。"客户希望构建比现在大几个数量级的 AI 数据库——Grace Hopper 就是为此而生的引擎。它非常适合处理超大数据集,比如推荐系统的 AI 数据库、以及大语言模型。"
这是 NVIDIA 第一次把 CPU + GPU 合体超级芯片的形态推上舞台,为后来的 GB200、Vera Rubin 打下了模板。
DGX Cloud:AI 从此"一个浏览器就能用"
"DGX H100 是全世界客户构建 AI 基础设施的蓝本——它现在全面量产。" H100 超算开始在全球上线:Oracle Cloud Infrastructure、Amazon Web Services(EC2 UltraClusters,可以扩展到 20000 颗 H100)、Microsoft Azure(ND H100 v5)、Meta(Grand Teton)——OpenAI 则继续用 Azure 上的 H100 做研究。
但最具颠覆性的不是硬件,而是发布模式的变化。"为了让创业公司和企业尽快用上 DGX,我们宣布 NVIDIA DGX Cloud——通过与 Microsoft Azure、Google Cloud、Oracle Cloud Infrastructure 合作,把 NVIDIA DGX AI 超级计算机送到每一家公司、通过一个浏览器就能用。"
企业可以按月租用 DGX Cloud 集群,快速上线超大规模、多节点的训练任务。"DGX Cloud 同时拥有 NVIDIA AI 的最佳能力和世界顶级云服务商的最佳能力。"
这一步的意义被他自己总结得很清楚:这既让 NVIDIA 的生态走向云,也借云的触达放大了 NVIDIA 的规模。NVIDIA 不再跟云平台竞争,而是把自己变成云上最强的 AI 超算层。
NVIDIA AI Foundations:生成式 AI 的"工厂"
为了服务想用自己的私有数据训练定制大模型的客户,他发布了 NVIDIA AI Foundations——一组云服务:
- NeMo:构建自定义文本生成模型。
- Picasso:训练自定义视觉大模型的服务——用你的授权或专有内容。
- BioNeMo:面向 2 万亿美元的药物发现行业。
合作伙伴名单本身就是一份"谁在抢跑生成式 AI"的地图:Adobe(下一代创意 AI)、Getty Images(负责任的 text-to-image / text-to-video 基础模型)、Shutterstock(text-to-3D 基础模型)。而在生物医药这端,Amgen、Alchemab Therapeutics、AstraZeneca、Evozyne、Innophore、Insilico 都加入 BioNeMo 早期访问。
他同时宣布 NVIDIA 与 Medtronic 合作——"全球最大的医疗技术公司"——共同构建一个软件定义医疗设备的 AI 平台。Medtronic 的 GI Genius 系统(用 AI 做早期结直肠癌检测)将基于 NVIDIA Holoscan 出货。"全球 2500 亿美元的医疗器械市场正在被改写。"
四块推理平台:从 L4 到 H100 NVL 到 Grace Hopper
推理不再是一块通用 GPU 的事情,而是要按工作负载分层:
- NVIDIA L4 for AI Video:相比 CPU 可以带来 120 倍的 AI 视频性能、99% 更优的能效。
- NVIDIA L40 for Image Generation:为图形 + 2D/视频/3D 图像生成优化。
- NVIDIA H100 NVL for LLM Deployment:为 ChatGPT 这类超大模型部署而生。
- NVIDIA Grace Hopper for Recommendation Models:理想地服务于图推荐模型、向量数据库、图神经网络。
Google Cloud 成为首家提供 L4 的云服务商。
Microsoft × NVIDIA:把 Omniverse Cloud 带给数亿企业用户
"Microsoft 和 NVIDIA 将把 NVIDIA Omniverse 带给数亿 Microsoft 365 和 Azure 用户。" 这句话是当天另一个标志性的商业合作。
Omniverse Cloud 作为一个完全托管的云服务,加上新一代 OVX 服务器、基于 RTX Ada 架构 GPU 的工作站,被推向全球企业用户。
而演示案例是 Amazon:Proteus——Amazon 第一台全自主仓储机器人——正在通过 NVIDIA Isaac Sim(基于 Omniverse 构建)的高保真数字孪生被训练。"帮助 Amazon 在它那些像洞穴一样大的仓库里,协调机器人与人类、其他机器人一起搬运货箱,同时省时省钱。"
数字化 3 万亿美元的汽车产业
"到 2030 年,汽车厂商要建 300 座工厂来生产 2 亿辆电动车;电池厂商还要再建 100 座超级工厂。数字化将大幅提升这个产业的效率、产量和速度。"
Omniverse 的合作伙伴地图:Lotus 用它虚拟装配焊接工位;Mercedes-Benz 用它建造、优化和规划新车型的装配线;Rimac 和 Lucid Motors 用它根据真实设计数据建数字展厅;BMW 用 Idealworks + Isaac Sim 生成合成数据训练工厂机器人,并且在工厂实际落成之前两年,就在 Omniverse 里完整构建了一座新的电动车工厂。
同时 BYD 宣布扩大 NVIDIA Drive Orin 在其新能源车产品线的使用范围。
cuLitho:让 2 纳米成为可能
这是当天最深的一个发布——也是黄仁勋最喜欢的类型:"一个每一家有工厂的公司都会有两个工厂"这个叙事的第一块基石。
"随着现在的制造工艺逼近物理极限,我们宣布 cuLitho——一个把加速计算带进计算光刻领域的突破。" NVIDIA 与 ASML、TSMC、Synopsys 联手:"cuLitho 被 TSMC(全球领先的晶圆厂)和 Synopsys(电子设计自动化领导者)集成进他们的软件、制造工艺和系统里,用于生产最新一代的 NVIDIA Hopper 架构 GPU。ASML 也计划在他们所有计算光刻软件产品里集成对 GPU 的支持。"
"光刻已经走到了物理极限。cuLitho 让这个行业能够走到 2 纳米、甚至更远。芯片产业是几乎所有产业的基础。"
这一段是 NVIDIA 从一家"做芯片的公司"走向"把自己的加速计算技术回馈给整个半导体制造业"的关键一步。
曲速引擎启动:帮助世界做不可能的事
收尾时,他更新了几个大数字——NVIDIA 已有 100 个加速库,包括 cuQuantum、刚刚开源的 CUDA Quantum、用于组合优化的 cuOPT、用于计算光刻的 cuLitho。"NVIDIA 的全球生态系统现在覆盖 400 万开发者、4 万家公司、1.4 万家 Inception 初创公司。"
"摩尔定律在放慢,而产业要同时应对可持续、生成式 AI 和数字化这三股动力。工业公司正在争先恐后地数字化、把自己重塑成软件驱动的科技公司——要做颠覆者,而不是被颠覆者。"
"加速(acceleration)是让你重获电力、实现 Net Zero 的最佳方式。我们一起,正在帮助这个世界做过去做不到的事。"
原文出处:NVIDIA 官方 wrap-up(blogs.nvidia.com/blog/gtc-keynote-spring-2023/)